Este documento generado con Rmarkdown (/analisis/compare-datasets.Rmd) está pensado para comparar dos bases de datos de Airbnb y poder evaluar los métodos de scraping.
¿Qué anuncios tienen en común? ¿cuáles no?
DH tiene 24029 anuncios.
IA tiene 19261 anuncios.
A. DH e IA tienen 13207 anuncios comunes.
B. DH tiene 10822 anuncios que no están en la IA.
C. IA tiene 6054 anuncios que no están en la DH.
Hay, por tanto 30083 anuncios (A + B + C) diferentes en total entre las dos bases de datos. Que concuerda con el valor 30083, que son el número de valores de id únicos entre DH e IA.
DH tiene 79.9% de los anuncios combinados de las dos bases de datos.
AI tiene 64% de los anuncios combinados de las dos bases de datos.
Fecha scraping: 2018-06-19
http://data.insideairbnb.com/spain/catalonia/barcelona/2018-08-14/visualisations/listings.csv
Fecha scraping: 2018-08-14